一篇劃時代論文,催生出ChatGPT!《Attention Is All You Need》作者們現在在哪?
一篇劃時代論文,催生出ChatGPT!《Attention Is All You Need》作者們現在在哪?

2017年,Google以一篇劃時代論文《Attention Is All You Need》,替今日的AI風潮打下基礎。

論文中的語言模型Transformer,是ChatGPT、語言模型GPT背後的關鍵架構。Transformer最重要的突破,除了語言模型的運作流程之外,就是「平行化」,讓很多處理工作可以在同一時間完成,讓算力有了用武之地。史丹佛大學研究人員在2021年一篇論文中點出了Transformer模型的重要性:「它不僅推動了AI領域的典範轉移,更擴大了對AI可能性的想像。」

Transformer AI模型
Google在2017年一篇劃時代研究論文《Attention Is All You Need》中,介紹了他們開發的Transformer語言模型,此模型透過強大神經網路,能夠學習文字、影像資料間的連續關係和深層意義,總而言之,它讓AI更像了一個真正的「人」。

而在該篇論文中共有8名作者,在Transformer問世後至今6年的時間,他們都在做些什麼?

開發Transformer模型的人陸續離開Google,成為新生代矽谷創業家

論文《Attention Is All You Need》的作者,現在都在做什麼?
開發Transformer的工程師們,幾乎都紛紛出走Google、自立門戶,直至今日,他們創立的新創募資總金額來到10億美元,在矽谷發揮著舉足輕重的影響力。
圖/ Meet 創業小聚

撰寫《Attention Is All You Need》這篇論文的8位工程師和科技專家,幾乎都陸續離開了Google,朝向下一個目標邁進。

作者1:Illia Polosukhin轉向區塊鏈發展,創辦NEAR Protocol

Illia Polosukhin離開Google後,創辦了去中心化平台NEAR Protocol。Illia Polosukhin深刻體會到,如果引領科技的組織,全面掌控了網路時代的數據,那麼人們就可能無法再自由取得、使用資料,這也是他毅然決然離開Google的原因。

為了讓網際網路的生態保持創新,他打造了以區塊鏈為基礎的去中心化平台NEAR Protocol,讓大眾都可以在這個平台上自由的開發應用程式,揮灑創意。

作者2:Aidan Gomez以對抗壟斷為目標,開發大型語言模型API公司Cohere

2019年9月,Aidan Gomez創辦了Cohere,Cohere也以對抗大型科技公司壟斷AI研究為目標,建立了幫助企業建構大型語言模型的API,它還在2022年啟動一間Cohere For AI的非營利性研究實驗室,致力讓大眾享有AI技術服務。根據《路透社》報導,Cohere估值已經來到60億美元。

作者3:Jakob Uszkoreit投入生技領域,創辦Inceptive

而被許多人視為是開發Transformer的主要工程師Jakob Uszkoreit,則在2021年辭職投入了生技領域,他所創辦的Inceptive,透過深度學習技術設計核糖核酸(RNA)分子,用以開發新興藥物,目前已募集了2,000萬美元的資金。

作者4:Niki Parmar和Ashish Vaswani共同創辦了AI新創Adept

Niki Parmar和Ashish Vaswani也在2021年底相繼離開Google,共同創辦了Adept。Niki Parmar曾在《財富》的採訪中透漏,只有創業才能真正讓她實踐開發產品與科學研究的理想。

而Adept建構的ACT-1,正是基於他們先前研究的Transformer進一步優化的大型模型,能學習人們瀏覽網頁和使用軟體的方式,替人們把文字指令轉換為一系列動作。Adept現階段估值已來到10億美元,總募資額高達4.15億美元。

作者5:Noam Shazeer要讓虛擬人物有靈魂,創辦Character.ai

在Google工作20年的Noam Shazeer,同樣選擇在2021年底創業,和同為Google工程師的朋友一起打造了對話式AI平台Chracter.ai,這個平台能讓使用者和AI合作一同編寫對話,並且生成角色扮演式的文字回覆。它近日也剛以10億美元的估值獲得了1.5億美元的投資金。

作者6:Lukasz Kaiser跳槽加入OpenAI,Llion Jone則繼續留在Google

其餘兩人,Lukasz Kaiser和Llion Jone,前者在2021年時跳槽加入OpenAI,後者則選擇繼續待在Google,他是目前8位撰文的研究成員中,唯一還待在Google的工程師。

總結來說,開發Transformer的8位工程師,自立門戶的並不在少數。直至今日,他們創立的新創募資總金額來到10億美元,在矽谷發揮著舉足輕重的影響力。這些新創們的重要成績,似乎有一點2000年「PayPal 黑幫」(PayPal Mafia)的影子。

從PayPal到Google,矽谷下一個黑幫會是誰呢?

矽谷黑幫,指的是企業中的重要人才離開後,把過往的人脈、經驗、技術、資源投入到新的項目中,創造出更廣闊的網絡。

例如PayPal創辦人Peter Thiel現在成立了大數據分析公司Palantir,還投資培育了Facebook創辦人祖克柏等年輕新秀,其他PayPay核心成員如Keith Rabois、Reid Hoffman等則分別是FinTech新創Square的營運長、LinkedIn的創辦人等等。

其實,Google在2010年前後,也曾出現不同於PayPal創業形式的黑幫現象,《富比士》將它稱作「高階主管的Google黑幫」。當時,Google內部各個高階主管紛紛跳槽到像Facebook、Twitter以及Yahoo等科技公司,或離職成為專業新創投資人,劇烈的成員變動同樣為當時的科技業帶來影響與熱議。

現在,以《Attention Is All You Need》論文作者們為首的創業潮,又出現了另一個黑幫的影子,他們就像是為科技產業引入生成式AI的引導者,讓基於Transformer模型而生的生成式AI新創在矽谷遍地開花。

但是,真正讓這波生成式AI風潮成形的並不是Google,而是另一個透過ChatGPT將AI發揚光大的修行者——OpenAI。

OpenAI將催生下一波AI黑幫?

因ChatGPT備受關注的OpenAI,在過去5年裡,迎來30多位高層、工程師和研究員離職潮,他們多數都創辦了自己的公司,這些新創募資金額總計也超過了10億美元。或許我們正見證OpenAI黑幫成形的過程。

舉例來說,幫OpenAI開發了GPT-2和GPT-3模型的前研究副總監Dario Amodei,以及安全與政策副總監Daniela Amodei,就帶領OpenAI將近10位核心員工,另外創辦了以研究為導向的新創Anthropic,強調AI的安全性和共享性,發表了AI研究的基礎規則。

OpenAI前研究科學家Peter Chen也離開了OpenAI,他和加州大學柏克萊分校教授Pieter Abbeel等人聯手創辦Covariant,專注在創造新型AI機器人解決方案。而OpenAI前工程總監David Luan,也是和Google前研究員Niki Parmar和Ashish Vaswani共同創辦Adept的成員之一。

silicon valley_shutterstock_448884280Resize 1280.j
多數人認為,矽谷的OpenAI的黑幫已成形,這些從OpenAI出走的新創創辦人,現階段成為了矽谷和創投的新寵兒。
圖/ Shutterstock

矽谷中每隔一段時間迎來的創業風潮,就是持續創新的關鍵。因此,處於現在進行式中的Transformer、OpenAI黑幫,就是最值得密切關注的對象。

參考資料:[Ayosta]、[Analytics India Magazine]、[NewsBytes

本文授權轉載自:創業小聚

關鍵字: #創業 #創新創業
往下滑看下一篇文章
打造AI無法取代的人才力,聯發科技攜手Hahow for Business培育跨域人才成果豐碩
打造AI無法取代的人才力,聯發科技攜手Hahow for Business培育跨域人才成果豐碩

在AI新世代浪潮下,兼具軟實力與硬實力的「T型人才」已躍升為企業人才培訓的新焦點。以聯發科技攜手 Hahow for Business 推出的「SPARK 實習生跨域軟實力學習計畫」為例,正是企業積極布局未來、培育全方位新世代人才的具體行動。

人工智慧的快速演進,正全面重塑我們對「學習」與「人才」的想像。隨著知識獲取門檻變低、學習方式持續翻轉,企業人才培育模式也迎來嶄新變革。在這波轉型浪潮中,擅長單一領域的「I型專才」往往難以應對多元挑戰,相反的,具備專業深度與跨域協作能力的「T型人才」成為企業招募與培育的核心焦點。

以理工科學生為例,雖然在校期間累積了紮實的專業知識與技術基礎,但往往在進入職場後,因為溝通表達、協同合作與專案管理等軟實力相對薄弱,面臨諸多挑戰、無法發揮潛力。為縮短「學用落差」與提升新鮮人的職場適應力,聯發科技攜手Hahow for Business在2025年共同推出「SPARK 實習生跨域軟實力學習計畫」,將工程師的個人效能訓練藍圖,提前至實習階段。計畫透過Learn-Apply-Reflect與10%-20%-70%學習策略,打造出「自主學習→練習→實際應用」的學習循環,全面加速準聯發人的培養、為企業注入新世代的競爭力。

聯發科技與Hahow for Business以「SPARK 實習生跨域軟實力學習計畫」加速培育人才

聯發科技始終堅信,每一位年輕人都蘊含著無限的發展潛力,只要能匯聚多元能力,即可激盪出創新火花、點燃成長的力量。這樣的理念也體現在「SPARK 實習生跨域軟實力學習計畫」logo設計:6道光芒象徵聯發科技永續經營的六大基石–全球觀、創新、人才、公司治理、綠色營運與在地實踐;而5道光芒則代表個人效能聚焦的5項關鍵能力:問題分析與解決、溝通簡報與影響力、專案管理、創意思維與成長心態。

SPARK計畫為實習生提供清晰的學習路徑,結合豐富的線上學習資源、個人練習與小組作業,同時搭配實體知識萃取工作坊,形成自主學習、同儕學習與應用及反思的學習循環。讓實習生不僅可以學習知識與實用技能,並真正將軟實力應用於工作場域。舉例來說,線上課程學習涵蓋「金字塔表達法」、「定錨點架構」、「ANSVA結構」與「SMART原則」等工具,並在為期兩個月的實習中,透過每週的應用練習、知識萃取工作坊與同儕小組報告,系統化強化關鍵軟實力,讓學習不僅止於「知識的獲取」更是「行為的展現」。

hahow
圖/ 數位時代

來自國立清華大學通訊工程研究所的實習生彭同學深有感觸的說:「能進入同一間公司,代表大家的硬實力相差不大,真正決定我們能否做對事情、把事情做好,是有沒有足夠的軟實力協同合作與向上管理,建議從大學三年級開始培養,並且持續不斷精進。」

國立清華大學半導體研究學院的實習生鄭同學同樣肯定軟實力的重要性。她說:「在學校,教授指派任務通常有明確的評分指標,但在實習時,主管交付的任務往往保留很大的自由發揮空間,為確保彼此有共識,我的作法是主動思考任務的目的,以手寫筆記進行結構性思考與建立清晰的表達邏輯,在與主管進行口頭報告時,則是以『金字塔表達法–先結論、後細節』的方式進行溝通,持續修正與取得共識、精準展開下一步。」

「理工科學生很容易陷入技術細節、分享時不自覺就是滿滿的專業術語,但這樣的溝通模式未必有助於專案進展。」來自國立陽明交通大學資訊網路工程學系的實習生洪同學表示,有效的溝通應該要跳脫技術本位,站在對方角度,說出讓目標聽眾共鳴的話,才能推進合作。「透過這次實習,我學會以『定錨點架構』讓溝通內容更有邏輯與說服力,以及透過『ANSVA–Attention /Need /Solution /Visualization /Action–架構』強化提案表達,就算面對全新的領域,也能快速盤點重點,並與團隊展開更有效的協作。」

「SPARK 實習生跨域軟實力學習計畫」創造的成效十分亮眼。活動期間在校園舉辦的多元跨域校園講座滿意度高達 94.6%;而在實習階段,儘管實習生同時承擔主管指派的專案任務,平均完課率仍高達 87%,並獲得大量正面回饋。許多實習生分享:「無論未來職涯選擇何種方向,這段期間累積的軟實力,都將成為持續突破與創新的關鍵資產。」

三大學習目標,支持年輕人才快速適應跨部門協作及全球化職場環境

聯發科技長期深耕技術創新與人才培育,積極推動學生硬實力與軟實力的緊密整合,以加速新世代人才的成長與轉型。此次首度與Hahow for Business合作「SPARK 實習生跨域軟實力學習計畫」實踐三大學習目標:首先建立創新與成長心態;其次強化簡報與溝通影響力及團隊合作;最後,培養問題解決、專案管理與行動決策能力。

Hahow
圖/ 數位時代

同時參加「SPARK 實習生跨域軟實力學習計畫」與3個不同專案計畫的國立清華大學資訊工程研究所實習生李同學表示:「實習期間,我必須同時處理三個專案,時間被各種會議切割得十分零碎,參加每場會議前,我至少得花費10分鐘翻閱紀錄或回想進度,改用實習期間學會的心智地圖追蹤專案進度後,只要 1 分鐘就能快速掌握最新狀況,執行效率大幅提升。」

國立台灣科技大學電機工程研究所的實習生董同學則認為:「軟實力之所以重要,不僅因為它能幫助我們在事前做好規劃、提升溝通的精準度,更關鍵的是,隨著這些能力不斷累積,將更有勇氣面對挫折與挑戰,不會輕易喪失對科技或對人的熱情。」

整體而言,聯發科技攜手 Hahow 好學校的合作,不僅著眼於短期彌補能力缺口,更展現企業對未來人才的前膽佈局與長期投資。當理工學生兼具專業深度與跨域軟實力,學用落差得以有效縮減,人才成長曲線隨之加速,產業也能在新世代人才的驅動下持續創新,形成良性循環,進一步鞏固組織的核心競爭力。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓